2007, 29(11): 2734-2737.
doi: 10.3724/SP.J.1146.2006.00365
刊出日期:2007-11-19
论文探讨了TMA(目标运动分析)中基本的非线性估计问题;介绍了粒子滤波(PF)的基本思想和辅助变量PF(AVPF)的基本算法,特别针对空对海单站只测方位TMA(BO-TMA)问题应用AVPF和EKF(扩展卡尔曼滤波)进行了对照研究;建立了问题的离散非线性滤波估计模型;设计了典型的应用场景;给出了Monte Carlo仿真运行结果;表明AVPF具有更高的估计精度、更好的收敛特性和滤波一致性。
2022, 44(4): 1503-1512.
doi: 10.11999/JEIT210059
刊出日期:2022-04-18
现场可编程门阵列(FPGA)被广泛应用于卷积神经网络(CNN)的硬件加速中。为优化加速器性能,Qu等人(2021)提出了一种3维可变换的CNN加速结构,但该结构使得并行度探索空间爆炸增长,搜索最优并行度的时间开销激增,严重降低了加速器实现的可行性。为此该文提出一种细粒度迭代优化的并行度搜索算法,该算法通过多轮迭代的数据筛选,高效地排除冗余的并行度方案,压缩了超过99%的搜索空间。同时算法采用剪枝操作删减无效的计算分支,成功地将计算所需时长从106 h量级减少到10 s内。该算法可适用于不同规格型号的FPGA芯片,其搜索得到的最优并行度方案性能突出,可在不同芯片上实现平均(R1, R2)达(0.957, 0.962)的卓越计算资源利用率。